On the Expressive Flexibility of Self-Attention Matrices
نویسندگان
چکیده
Transformer networks are able to capture patterns in data coming from many domains (text, images, videos, proteins, etc.) with little or no change architecture components. We perform a theoretical analysis of the core component responsible for signal propagation between elements, i.e. self-attention matrix. ask following question: Can matrix approximate arbitrary patterns? How small is query dimension d required such approximation? Our first result shows that task deciding whether approximation given pattern possible not NP-hard fixed greater than one. In practice, typically exhibits two properties: it sparse, and changes dynamically depending on input module. Motivated by this observation, we show can provably sparse matrices. While parameters fixed, various matrices be approximated only modifying inputs. proof based random projection technique uses seminal Johnson-Lindenstrauss lemma. particular, that, order any up precision defined terms preserving element ratios, grows logarithmically sequence length n.
منابع مشابه
an investigation of the impact of self monitoring on langauge teachers motivational practice and its effect on learners motivation
the central purpose of this study was to conduct a case study about the role of self monitoring in teacher’s use of motivational strategies. furthermore it focused on how these strategies affected students’ motivational behavior. although many studies have been done to investigate teachers’ motivational strategies use (cheng & d?rnyei, 2007; d?rnyei & csizer, 1998; green, 2001, guilloteaux & d?...
the impact of cooperative questioning vs. self-questioning methods on the reading comperhension ability of iranian pre- intermediate efl learners
این تحقیق به بررسی تاثیر استفاده از روش پرسش مشارکتی در مقابل روش خود پرسشی بر توانایی خواندن زبان آموزان سطح پیش متوسطه ایرانی می پردازد. در این تحقیق تلاش شده تا متوجه شویم که آیا این استراتژی ها تاثیری بر روی توانایی خواندن زبان آموزان دارد یا نه و کدام یک تاثیر بیشتری دارد. بر این اساس 98 زبان آموز انتخاب و از طریق تست مهارتی ماک تافل همگن شدند. سپس محقق آنها را به سه گروه تقسیم کرد که این ...
Expressive flexibility.
Previous research has examined the consequences of either expressing or suppressing emotion using between-subjects designs. However, emotion theorists have argued that adaptation depends not so much on one regulatory process but rather on the ability to flexibly regulate emotion in accord with situational demands. To test this idea, Bonanno, Papa, Lalande, Westphal, and Coifman (2004) developed...
متن کاملthe effect of self-confidence and educational motivation on oral translation quality
this thesis is about the effect of self-confidence and educational motivation on oral translation quality.
on the relationship between self- regulated learning strategies use and willingness to communicate in the context of writing
این تحقیق به منظور بررسی رابطه بین میزان استراتژیهای خود-تنظیم شده یادگیری و تمایل به ایجاد ارتباط دانشجویان زبان انگلیسی انجام شده است.علاوه بر این،روابط و کنش های موجود بین ریزسنجه های استراتژیهای خود-تنظیم شده یادگُیری ، مهارت نگارش و تمایل به برقراری ارتباط و همچنین تاٍثیرجنسیت دانشجویان زبان انگلیسی در استراتژیهای خود-تنظیم شده یادگیری و تمایل به برقراری ارتباط آنها مورد بررسی قرار گرفته شد.
15 صفحه اولذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Proceedings of the ... AAAI Conference on Artificial Intelligence
سال: 2023
ISSN: ['2159-5399', '2374-3468']
DOI: https://doi.org/10.1609/aaai.v37i7.26055